Extrahierung bibliographischer Daten aus dem Internet

نویسندگان

  • Paul Ortyl
  • Stefan Pfingstl
چکیده

Im Projekt FIS-I, das vom Bundesministerium für Bildung und Forschung (BMBF) gefördert wird, soll der Zugriff auf Informatik-Literatur zentralisiert werden. Die Projektpartner Universtät Karlsruhe (Collection of Computer Science Bibliographies) und TU München(LEABiB) stellen hierfür die bibliographischen Daten bereit. In diesem Beitrag werden die praktischen Erfahrungen vorgestellt, die bei der Erfassung und Bearbeitung von bibliographischen Daten gesammelt wurden. Erstens wird betont, dass die genaue Einhaltung von Standards (u. a. OAI-PMH) wesentliche Grundlage für die Interoperabilität ist. Dadurch kann die Datenqualität erhöht und überflüssige und fehlerträchtige Anpassungsarbeit erspart werden. Zweitens werden die Probleme bei der Datenerfassung mittels Wrapper aufgezeigt. 1 Open Archives Initiative Die Open Archives Initiative3, die um die Jahreswende 1999/2000 gegründet wurde, beschäftigt sich mit der Verbreitung und Vernetzung von Dateien über vorhandene Zeitschriften und Vordrucke (eprints). Es wurde ein Protokoll [OAI03] (Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH)) entworfen und implementiert, welches die einfache Sammlung von Metadaten ermöglicht. Die Collection of Computer Science Bibliographies [Ac04] als Dienstleistungsanbieter (und Datenanbieter für das io-port.net Projekt) integriert unter anderem die Daten, die durch OAI-PMH zur Verfügung stehen, in den internen, durchsuchbaren Datenbestand. Trotz des möglichst genau spezifizierten Protokolls (OAI-PMH) und bekannten Datenaustauschformats (Dublin Core (DC) [DCMI]) gibt es in der Praxis viele im weiteren Text beschriebene Probleme, die nicht immer einfach und sauber gelöst werden können. 1http://liinwww.ira.uka.de/bibliography 2http://wwwmayr.in.tum.de/leabib 3http://www.openarchives.org

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Integration externer Daten aus dem Internet in Planungs- und Kontrollsysteme-Konzeption und Entwicklung eines Redaktions-Leitstands

Interne und externe Führungsinformationen zu kombinieren, gewinnt für die Entscheidungsunterstützung zunehmend an Bedeutung. Gegenwärtig lassen sich externe Informationen schnell über das Internet beschaffen. Da deren Qualität und Quantität schwanken, sind sie für eine systematische Integration redaktionell aufzubereiten. Um das Problem der Informationsüberflutung nicht weiter zu verschärfen, b...

متن کامل

Ermittlung forstwirtschaftlicher Parameter aus mobilen terrestrischen LiDAR-Daten

Diese Arbeit befasst sich mit der Nutzung von mobil erfassten Daten von terrestrischen LiDAR (Light Detection and Ranging). Es wird dargestellt wie Informationen über Bäume aus solchen Daten gewonnen werden können. Dieses Paper ist im Rahmen einer Masterarbeit und der Zusammenarbeit der Firma Rucon-Engineering mit dem Leibniz-Institut für Agrartechnik Potsdam-Bornim entstanden.

متن کامل

Delegation von Datenmanagement in Szenarien verteilter Verantwortlichkeiten

Um Daten aus verschiedenen Datenbeständen miteinander in Verbindung bringen und daraus zusätzliche Informationen gewinnen zu können, werden diese oftmals aus verschiedenen Quellen heraus in einem gemeinsamen Datenbestand integriert. In Fällen, in denen die Personen oder Institutionen, die die Quelldaten erzeugt haben und verantworten, nicht in den Prozess der Erstellung und Nutzung integrierter...

متن کامل

Neue Konzepte für RDF-Managementsysteme

Durch die Erforschung und Standardisierung von Semantic-Web-Technologien wie dem Resource Description Framework und der Web Ontology Language werden auf lange Sicht große Mengen an semantisch annotierten Daten verfügbar sein. Daher werden Werkzeuge benötigt, die ein effizientes Verarbeiten, Transformieren und Anfragen dieser Informationen ermöglichen. Dieser Beitrag beschreibt die Operationen a...

متن کامل

Anwendung der Kriging-Approximation zur Anfertigung der Regenfallkarten für Polen

In der Arbeit wird die Anwendung von Kriging-Algorithmen zur Einschätzung der Werte jährlicher Regenfälle in ausgewählten Punkten eines Bereiches zur Anfertigung genauer Regenfallkarten dieses Bereiches besprochen. Das Verfahren der Kriging-Approximation besteht aus der Lösung algebraischer Gleichungen, aus mathematischer Modellierung und statischer Optimierung. Es werden ein Approximationsalgo...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2004